AlphaFold ist ein künstliches neuronales Netzwerk von Google DeepMind und basiert auf der Transformer-Architektur. Es ist in der Lage, anhand von Aminosäuresequenzen dreidimensionale Proteinstrukturen vorherzusagen. Die Künstliche Intelligenz erreicht bei ihren Vorhersagen die Genauigkeit experimenteller Methoden und schafft damit den Durchbruch zur Lösung des schon viele Jahrzehnte bestehenden Proteinfaltungsproblems.
AlphaFold ist der Name eines vom in London ansässigen und seit 2014 zu Google gehörenden Unternehmen DeepMind entwickelten künstlichen neuronalen Netzwerks. Es kann dreidimensionale Proteinstrukturen basierend auf den Aminosäuresequenzen der Proteine sehr genau vorhersagen. Die zweite Version der Künstlichen Intelligenz AlphaFold2 erreicht teilweise die Genauigkeit experimenteller Methoden. Im Jahr 2020 erzielte AlphaFold im alle zwei Jahre durchgeführten Wettbewerb CASP (Critical Assessment of Techniques for Protein Structure Prediction) Bestwerte. In der Fachwelt gilt damit das seit mehreren Jahrzehnten bestehende Proteinfaltungsproblem als zum Teil gelöst.
AlphaFold ist ein Deep-Learning-System und basiert auf der Transformer-Architektur. Die Künstliche Intelligenz wurde mit den Daten bereits bekannter, experimentell ermittelter dreidimensionaler Strukturen zahlreicher Proteine trainiert. Im Jahr 2021 wurde AlphaFold und die Funktionsweise der Künstlichen Intelligenz der Öffentlichkeit frei zugänglich gemacht. AlphaFold unterliegt als Software einer Open-Source-Lizenz und kann von kommerziellen Unternehmen genutzt werden. Die Software ist auf GitHub frei verfügbar.
Zusätzlich steht seit 2021 mit der AlphaFold Protein Structure Database eine Datenbank mit mehreren Hunderttausend 3D-Proteinstrukturen zur Verfügung. Die Datenbank bietet freien Zugang zu Proteinstrukturen des menschlichen Proteoms (Gesamtheit aller Proteine des menschlichen Körpers) und zu Proteomen weiterer Organismen. 2022 stellte das Unternehmen Meta mit ESMFold (Evolutionary Scale Modeling Fold) ein weiteres KI-Modell zur Vorhersage von dreidimensionalen Proteinstrukturen vor.
Grundsätzliche Problemstellung der Vorhersage von Proteinstrukturen
Proteine bestehen aus Aminosäuresequenzen. Sie falten sich abhängig von diesen Sequenzen und bilden dreidimensionale Strukturen. 1972 erhielt Biochemiker Christian Anfinsen den Nobelpreis der Chemie für seine Forschung und die Erkenntnis, dass sich die dreidimensionale Struktur eines Proteins aus der Aminosäuresequenz ableiten lässt. Die dreidimensionale Struktur ist maßgeblich für die Eigenschaften und die biologischen Funktionen eines Proteins verantwortlich. Der Mechanismus der Proteinfaltung ist komplex und von zahlreichen Faktoren abhängig. Für Wissenschaftler ist es seit vielen Jahrzehnten eine große Herausforderung, die Proteinfaltung zu ermitteln. Mit experimentellen Methoden wurden in über 60 Jahren die dreidimensionalen Strukturen von nur rund 170.000 Proteinen bestimmt. Es sind aber bereits mehr als 200 Millionen Proteine bekannt.
Eine exakte theoretische Ableitung der 3D-Struktur aus der Aminosäuresequenz wäre für die Forschung sehr vorteilhaft, da sie weniger Aufwand als eine experimentelle Bestimmung der 3D-Struktur mit hochspezialisierten Methoden verursachen würde. Aus diesem Grund forschen viele Wissenschaftler weltweit daran, das Proteinfaltungsproblem zu lösen. Da die Anzahl an Varianten, in die sich Proteine falten können, riesig ist, nimmt eine theoretische Berechnung eine nicht bereitstellbare Menge an Rechenkraft und Zeit in Anspruch. Mit den bisher entwickelten Berechnungsmethoden erreicht man nur bei einfachen und kleinen Proteinen gute Ergebnisse, die an die Genauigkeit experimenteller Methoden heranreichen. Der Ansatz, die Proteinfaltung mithilfe eines künstlichen neuronalen Netzes und Deep Learning vorherzusagen, hat für einen Durchbruch gesorgt. Für Teile der Fachwelt gilt mit AlphaFold2 das Problem der Proteinfaltung als weitgehend gelöst.
Prinzipielle Funktionsweise und Training von AlphaFold
AlphaFold ist ein künstliches neuronales Netzwerk. Es verwendet als Eingabedaten die Primärstruktur von Proteinen (Aminosäuresequenz) und liefert als Output dreidimensionale Strukturen der Proteine (zum Beispiel Sekundär- und Tertiärstrukturen). Hierfür analysiert das auf der Transformer-Architektur basierende und den Aufmerksamkeitsmechanismus verwendende neuronale Netz die Distanzen zwischen den Aminosäuren und Winkel chemischer Verbindungen. Die prinzipielle Funktionsweise des neuronalen Netzes ist vergleichbar mit den Netzen, wie sie für die Verarbeitung natürlicher Sprache (zum Beispiel GPT-3 oder BERT) oder die Bildanalyse zum Einsatz kommen.
AlphaFold bildet einen räumlichen, die Proteinstruktur repräsentierenden Graphen mit Knoten und Kanten und bezieht zur Vorhersage der Faltung geometrische und physikalische Informationen mit ein. Trainiert wurde AlphaFold mit den rund 170.00 bekannten Proteinstrukturen aus der Protein Data Bank (PDB) und weiteren Datensätzen von Proteinsequenzen. Das Training dauerte mehrere Wochen und wurde auf Rechnern mit TPUv3-Chips von Google durchgeführt. Die Inferenz zur Bestimmung der 3D-Strukturen von Proteinen nimmt wesentlich weniger Zeit in Anspruch.
Anwendungsmöglichkeiten von AlphaFold
Die Vorhersage der dreidimensionalen Strukturen beliebiger Proteine mit AlphaFold bietet eine Vielzahl an Anwendungsmöglichkeiten in der Wissenschaft und Technologie. Sie beschleunigt die Forschung in vielen Bereichen der Medizin, Biologie und Chemie. AlphaFold wurde beispielsweise verwendet, um dreidimensionale Strukturen und damit Eigenschaften der Spike-Protein von SARS-CoV-2 (Coronavirus) vorherzusagen. Typische Einsatzbereiche von AlphaFold sind:
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
medizinische Grundlagenforschung
Erforschung von Krankheiten und Entwicklung neuer Medikamente
personalisierte molekulare Medizin (Entwicklung von Wirkstoffen und Therapien für einzelne Patienten)
Entwicklung neuer Biotechnologieprodukte
Entwicklung technischer Enzyme für industrielle und chemische Prozesse
Einsatz im Umweltschutz, zum Beispiel für eine umweltfreundliche, nachhaltige Chemieproduktion oder den Abbau von Plastik
Agrarwissenschaft, zum Beispiel verbesserte Züchtung von Pflanzen und Tieren